20.5.2 추측 디코딩(Speculative Decoding): 작은 모델로 큰 모델 가속하기

20.5.2 추측 디코딩(Speculative Decoding): 작은 모델로 큰 모델 가속하기